查看原文
其他

人工智能算法模型库浅析

一、引言

人工智能在近几年出现了突飞猛进的发展,尤其是深度学习的提出以及在多个领域的成功应用,使人工智能成为当前学术界和产业界的研究热点之一。


如果把人工智能比作一辆轰鸣的战车,那么算法和模型则扮演着“发动机”的角色。“发动机”的质量在一定程度上直接影响、甚至决定了“战车”最终的效力。从学术角度来看,算法和模型一直以来都是人工智能研究的重点,涌现的大量成果直接推动了人工智能技术的迭代发展。从产业角度来看,算法和模型是人工智能技术在生产实践中真正落地、促进产业发展的重要保障。


二、人工智能算法和模型发展现状

人工智能算法模型经过长期积累已覆盖多个研究子领域。以机器学习为例,较为核心的算法包括最小二乘法、K近邻算法、K均值算法、PCA分析法、梯度下降法、进化算法等,较为核心的模型包括线性回归、逻辑回归、决策树、聚类、支持向量机、前馈神经网络等。由于具备较完备的理论基础和长期的推广应用,这些算法模型已经成为相关问题的标准解决方案。当前,针对这些核心算法和模型的进一步研究和改进也在不断向前推进。


人工智能在近些年的巨大突破也催生了一批“年轻的”算法和模型。以深度学习为例,新算法使得挖掘数据高层抽象特征成为可能,例如反向传播算法等,而新模型则为解决复杂问题提供了可行路径,例如深度神经网络、玻尔兹曼机等。这些算法模型极大简化了传统机器学习处理信息的方式,成为了计算机视觉、自然语言处理等领域的主流解决方案。可以预见,人工智能领域的新算法和新模型将会源源不断的涌现,并持续改变和优化传统领域的工作模式。


主流算法模型库对常见算法模型进行了高效实现,成为了人工智能生态中的重要一环。例如,Tensorflow框架集成了适配多种语言的机器学习和深度学习算法模型,并且适用于强化学习和迁移学习等新领域,同时提供了模型管理组件,支持模型的持久化存储、导入和导出。Caffe框架集成了卷积神经网络相关算法模型,拥有大量训练好的经典模型以及近几年提出的新模型(VGG、Inception、ResNet等),被广泛应用于工业界和学术界。CNTK框架支持多种神经网络模型,并集成了AdaGrad、RmsProp等多种优化算法,基于微软在人工智能领域研究成果,提供了细粒度的功能组件和可扩展的模型定制化能力。Keras框架专注于深度学习,不仅提供了可灵活搭配的模型模块,还集成了Adam、批标准化、PReLU等多种优化算法,以高度的模块化向用户提供简易的模型实现方式。MXNet集成了大量神经网络模型,支持多语言封装,并支持在移动设备上运行,目前已成为AWS的推荐深度学习框架。我国在算法模型库的建设上也崭露头角。百度推出的PaddlePaddle框架提供了针对计算机视觉和自然语言处理的模型库,集成了MobileNet、SE-ResNeXt等最新模型。腾讯、阿里等企业也在人工智能算法模型领域贡献了大量成果。


三、算法模型库的重要性分析

夯实人工智能基础,确保掌握关键核心技术。人工智能的原理和思想需要通过模型和算法予以展现,人工智能研究的发展必定要基于已有的算法模型,也一定会带来算法模型的升级更新。一个完备的算法模型库既是对当前算法模型研究的总结归纳,又是开拓下一个研究阶段的起点,有益于夯实我国人工智能研究的基础,是掌握人工智能关键核心技术不可或缺的一步。


推动人工智能各领域研究,催化人工智能技术全面健康发展。人工智能是一个复杂交叉学科,覆盖多个子领域,任何一个领域的研究短板都可能制约其他领域的进一步发展。算法和模型是这些领域间为数不多的交叉点之一,是各领域开展研究的共同必备要素。一个完备的算法模型库为各领域研究提供基础支撑,在一定程度上弥补了领域间隔阂,实现了领域知识的交叉共享,有利于推动人工智能技术的全面健康发展。


激发传统学科研究取得突破,走出多学科交叉融合、共同发展的新路径。人工智能提出了一套异于传统学科的思维模式,利用机器学习、深度学习等技术解决传统学科中的复杂性问题成为了可能。向传统学科引入人工智能方法,不断将算法和模型应用到研究工作中,同时吸收多学科知识来丰富和完善人工智能算法和模型,相互反馈、互相融合、共同发展,激发传统学科研究走出新路子,取得新突破。


助力人工智能技术的产业应用,促进产业发展升级。我国的产业发展具有海量数据和市场规模持续增长的特征,人工智能技术也因此拥有巨大的应用潜力和优势。结合产业特点建设算法模型库,既保证人工智能技术有的放矢,也大幅降低传统产业融合人工智能技术的门槛,是推动人工智能在产业界持续广泛深入应用的重要保障。


四、算法模型库建设的初步考虑

人工智能算法模型库的建设是一个以知识为核心、研发与管控相结合的系统工程,可以从以下几点探索开展。


统一规范,建立标准。算法模型库涉及多学科、多领域的知识体系,不同体系的算法模型在描述、结构、实现等方面均存在差异,在一定程度上阻碍了算法模型的整合。通过建立适当的标准体系,统一算法模型的描述,合理约束算法模型的实现,兼顾一致性和灵活性,从而能够在包容开放的基础上进一步为扩充和升级做出指导。


开展评测,去伪存真。人工智能的研究进展迅速,新算法新模型不断涌现,以开放模式建设算法模型库,必然会面对如何评估算法模型优劣的问题。通过研究制定面向算法模型的评估方法,建立评估机制,跟踪评测算法模型质量,做到去粗取精、去伪存真,从而保证算法模型的有效性、可靠性和安全性。


推广应用,形成闭环。建设算法模型库的最终目的是要服务于实际,在实践中对算法模型进行充分的检验和验证是推动算法模型进一步发展的重要途径。积极推进算法模型库在各领域各行业的应用,将实际效果反馈给算法模型研究者,形成理论与实践的反馈闭环,从而在深化人工智能技术应用的同时,不断促进算法模型的优化和创新。


五、展望

人工智能是新一轮科技革命和产业革命的重要驱动力量,算法和模型是人工智能技术的知识输出。建设完备的算法模型库是掌握关键核心技术、突破科技和产业发展瓶颈的重要一步,具有深远意义和巨大价值。探索建立一个开放灵活、标准可控、安全优质的算法模型库,是进一步深入发展人工智能技术的必要环节,也必然会在科技和产业发展的各个方面大展身手。



作者简介

徐骁麟,博士,中国信息通信研究院技术与标准研究所工程师,毕业于华中科技大学计算机学院,主要研究领域为云计算、分布式计算、人工智能。

联系方式:xuxiaolin@caict.ac.cn



校  审 | 陈  力、 珊  珊

编  辑 | 凌  霄



欢迎转发分享!

如需转载,请联系授权事宜:

电话:62300198 

Email:media@caict.ac.cn


推荐阅读

推进新时代信息化立法的思考

抓住智能零售新浪潮,拥抱数字经济新未来


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存